智能论文笔记

Machine Learning Application Development: Practitioners' Insights

Md Saidur Rahman , Foutse Khomh , Alaleh Hamidi , Jinghui Cheng , Giuliano Antoniol , Hironori Washizaki

分类：机器学习

2021-12-31

如今，由于最近在人工智能（AI）和机器学习（ML）中的近期突破，因此，智能系统和服务越来越受欢迎。然而，机器学习不仅满足软件工程，不仅具有有希望的潜力，而且还具有一些固有的挑战。尽管最近的一些研究努力，但我们仍然没有明确了解开发基于ML的申请和当前行业实践的挑战。此外，目前尚不清楚软件工程研究人员应将其努力集中起来，以更好地支持ML应用程序开发人员。在本文中，我们报告了一个旨在了解ML应用程序开发的挑战和最佳实践的调查。我们合成从80名从业者（以不同的技能，经验和应用领域）获得的结果为17个调查结果;概述ML应用程序开发的挑战和最佳实践。参与基于ML的软件系统发展的从业者可以利用总结最佳实践来提高其系统的质量。我们希望报告的挑战将通知研究界有关需要调查的主题，以改善工程过程和基于ML的申请的质量。

translated by 谷歌翻译

当分别从$ \ mathfrak {l} $ - subgaussian分布和重尾分布中，分别采样协变量和噪声时，我们考虑了线性回归系数的鲁棒和稀疏估计，并由对抗性和噪音污染异常值。我们处理两种情况：协变量的已知或未知协方差。特别是在前一种情况下，我们的估计器几乎达到了信息理论上的最佳错误绑定，而我们的错误界限比以前处理类似情况的研究更明显。我们的估计分析在很大程度上依赖于通用链条来得出急剧的误差界限。

translated by 谷歌翻译

我们考虑对线性回归系数的强大估计。在本说明中，我们关注的是从$ l $ subgaussian分布以未知协方差进行取样的情况，从具有有界的绝对力矩的分布中采样了噪音，并且两个协方差和噪音都可能受到敌人的污染。我们得出一个估计误差结合，该误差取决于稳定的等级和协方差矩阵的条件数，具有估计的多项式计算复杂性。

translated by 谷歌翻译

当产出被对手污染时，我们认为稳健的低秩矩阵估计作为痕量回归。允许对手添加任意输出的任意值。这些价值可以取决于任何样本。我们处理矩阵压缩感，包括套索作为部分问题，矩阵完成，然后我们获得锐利估计错误界限。为了获得不同型号的错误界限，例如矩阵压缩感测和矩阵完成，我们提出了一种简单的统一方法，基于Huber损失函数和核规范惩罚的组合，这是传统方法的不同方法。在本文件中获得的一些错误界限比过去的误差。

translated by 谷歌翻译